DAY1 知識之章-啟程

2025 iThome 鐵人賽

DAY 1

Build on AWS

動漫宅的 30 天 AWS Lakehouse 修行日誌系列第 1 篇

17th鐵人賽 aws

AndyChen1127

團隊三陳牛肉吉事堡

2025-09-15 21:13:09

382 瀏覽

分享至

簡介

Hi 我是 Andy 一個「宅宅數據工程師」，這是我第一次參加鐵人賽，我想透過此次競賽來學習一些 AWS 的相關服務，順便鍛鍊一下我撰寫文章的能力，此系列我將以自己的興趣為主題，來增加每天撰文章的動力。

前言

我常常在想，自己喜歡的事物，到底有多少人也同時喜歡?

所以本次我們將透過其他動漫愛好者「已搜集一段時間」的資料集來作為來源資料，搭配使用 AWS 雲端服務來更進一步的將資料做 ELT 後，最後再使用 BI 工具建立「可視化報表」，來讓自己更輕鬆的看出大家對於各部動漫的喜好程度和評價。

本系列規劃

本系列為期三十天，場景是透過 AWS 雲端服務打造一個數據架構，並建立簡易的 Data Pipeline 來處理本次的動漫數據，接著會透過一些維運的服務，來了解各個服務的運作狀況，所以我安排了以下幾個任務章節。

任務章節：

知識之章：學習資料領域知識
雲基礎之章：實際建立 AWS 帳號、IAM、VPC 和資料上傳等相關服務應用
淬鍊之章：使用 Glue PySpark 淬煉資料 + Iceberg 元數據管理
視覺之章：QuickSight 資料可視化、Lake Formation 資料權限治理
監控之章：CloudWatch、CloudTrial 等維運服務應用
回顧之章：成本評估、系列內容回顧

從「理論」到「實作」再到「監控服務正常運作」，讓我們一同踏上這場動漫數據的煉金之旅！

結論與建議

由於時間的限制，本系列文章不會特別詳細的介紹到各服務、工具的深度底層原理，但會透過實際案例帶大家走一遍簡易的數據工程 Pipeline 設計。

下篇預告

下篇我們將進入「DAY2 知識之章-理解資料本源」，讓我們一起來了解動漫資料集的詳細內容。

參考資料

[1] ETL 與 ELT 之間有什麼區別？

DAY2 知識之章-理解資料本源

系列文

動漫宅的 30 天 AWS Lakehouse 修行日誌共 30 篇

RSS系列文訂閱系列文

10 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

1 則留言

Wolke

iT邦研究生 4 級 ‧ 2025-10-10 18:34:07

感謝未知作者的精彩分享！

這個主題很有趣，感謝您的詳細說明和實作經驗分享。

實際的程式碼範例很有幫助，讓理論更容易理解。

也歡迎版主有空參考我的系列文「南桃AI重生記」：https://ithelp.ithome.com.tw/users/20046160/ironman/8311

如果覺得有幫助的話，也歡迎訂閱支持！

回應
檢舉

登入發表回應

我要留言

立即登入留言

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

AI會議轉錄如何盡可能縮小明文攻擊面？

IT邦幫忙

動漫宅的 30 天 AWS Lakehouse 修行日誌系列 第 1 篇